а и 


| 


м 10 вышаем ж и вучёст СТЬ В а р 79 т 
В ИТ 


Сер р ге й 
а не В и ч 


Меню 


. КаН омегмем 
› Термины: ]доигпа|, Тегт, 1$М 
° Выборы 
о Гарантии 
° Ожидания |= Реальность 
е ВаН / Тагапфоо!: особенности 
е Надстройки Кай 


° Рге-\фе 
° ЭрИ-\/яже ащесйоп 
°о Кепств 


№ НИГоаа ** 
Тагапфоо] (но) на» и 


Ка оуеглем/: Термины 


е КаН - алгоритм достижения консенсуса в распределенных системах 

е КаК достигает консенсуса за счет выбора единого лидера, который 
может изменять состояние системы 

. Лидер выбирается в рамках фегт — пронумерованного отрезка 
времени 

е Лидер может добавлять записи в журнал (105) 

Каждая запись в журнале пронумерована 10# тдехЛо? 5едиепсе 
питБег (1$№) 


4 НИГоаа** 
Тагаптоо! (не) нь ы 


КаЁ омегмем: Выборы 


{теоц\т, 
{ам еесНоп$ 


ацогит о мо{е$ 


гесеме4, ргото{е |еадег 


РоНомег Сап!Ча{е 


Моде мий МеПег{егт ог 
[еадег т сиггеп* фегт 415соуегеа 


Моде ммиП Н!Пег{егт 415соуегеа, 
гез!ап |еадег$ р 


№ НИГоаа ** 
Тагапфоо] (но ни" я 


КаЁ омегмем: Выборы 


{теоц+ . иогит о мокез 
" Сапа е Ч 


54а" еесйоп$ гесе№мед, ргото*е [еааег 


ЕоПо\мег 


Моде мий МеПег{егт ог 
[еадег т сиггеп* фегт 415соуегеа 


Моде ммиП Н!Пег{егт 415соуегеа, 
гез!ап |еадег$ р 


№ НИГоаа ** 
Тагапфоо] (но ни" я 


КаЁ омегмем: Выборы 


{теоц\т, 
{ам еесНоп$ 


ацогит о мо{е$ 


гесеме4, ргото{е |еадег 


Еоо\мег Сап!4а{е 


Моде мий МеПег{егт ог 
[еадег т сиггеп* фегт 415соуегеа 


Моде ммиП Н!Пег{егт 415соуегеа, 
гез!ап |еадег$ р 


№ НИГоаа ** 
Тагапфоо] (но) на» и 


КаЁ омегмем: Выборы 


{теоц\т, 
{ам еесНоп$ 


ацогит о мо{е$ 


гесеме4, ргото{е |еадег 


РоЙомег Сап44а*е 


Моде ми Кегтегт ог 
[еадег т сиггеп+ фегтл 
Чссомегеа 


Моде ммиП Н!Пег{егт 415соуегеа, 
гез!ап |еадег$ р 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) нь и 


КаЁ омегмем: Выборы 


{теои, ь цчогит оф мо{е$ 
Сап44а*е Ч 


Ееадег 
5агЕ е!есНоп$ гесе!ме4, ргото{е 


ЕоПо\м/ег 


Моде мий МеПег{егт ог 
[еадег т сиггеп* фегт 415соуегеа 


Моде ммиП Н!Пег{егт 415соуегеа, 
гез!ап |еадег$ р 


№ НИГоаа ** 
Тагапфоо] (но ни" я 


КаЁ омегмем: Выборы 


{теоц\т, 
{ам еесНоп$ 


ацогит о мо{е$ 


гесеме4, ргото{е Геадег 


Еоо\мег Сап!Ча{е 


Моде мий МеПег{егт ог 
[еадег т сиггеп* фегт 415соуегеа 


Моде ммиП Н!Пег{егт 415соуегеа, 
гез!ап |еадег$ р 


№ НИГоаа ** 
Тагапфоо] (но ни" ы 


КаЁ омегмем: Выборы 


{теоц\т, 
{ам еесНоп$ 


ацогит о мо{е$ 


гесеме4, ргото{е Геадег 


РоНомег Сап!Ча{е 


Моде мий МеПег{егт ог 
[еадег т сиггеп* фегт 415соуегеа 


Моде мВ Р!5Вег егт 415со\егеа; 
ге$12п [еадег$ р 


№ НИГоаа ** 
Тагапфоо] (но ни" ы 


КаЁ оуегле\: Гарантии 


. ЕесНоп За у: один лидер в каждом {егт 

. 1еа4дег Аррепа-Оту: лидер только добавляет записи без 
модификации или удаления записей 

› [0 МаЕсИ Е: записи с идентичными индексом и {егт в двух 
журналах гарантируют их совпадение вплоть до этих записей 

. [еа4дег Сотр!еепе$$: запись в журнал в каком-либо {егт будет 
присутствовать в логах всех последующих лидеров 

. Эае МасИте $а{е\у: запись, примененная с определенным 
индексом на одном сервере, будет такой же и на другом сервере 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» р 


КаЁ оуегле\: Гарантии 


. Рано или поздно лидер найдётся (скорее всего) 
. В рамках одного {фегт есть не более одного лидера 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» р 


КаЁ оуегле\: Гарантии 
. Рано или поздно лидер найдётся (скорее всего) 


. В рамках одного {фегт есть не более одного лидера 


ЦОД 1 Од 


№ НИГоаа ** 
Тагапфоо] (но) на» ы 


КаЁ оуегле\: Гарантии 


. Рано или поздно лидер найдётся (скорее всего) 
. В рамках одного {фегт есть не более одного лидера 


При ограничениях 


. В кластере есть нода, имеющая необходимое количество 
соединений, чтобы выиграть выборы 


Тута сч Чаесноп = Тассёдетя 


№ НИГоаа ** 
Тагапфоо] (но) на» р 


Как оуеглем: Ожидания != Реальность 


е Рано или поздно != быстро 
. Тегт |= время 


№ НЕ>ИГоаа ** 
Тагапфоо] (но ни" ы 


Как оуегмлем: Ожидания != Реальность 


е Рано или поздно != быстро 
. Тегт |= время 


Рт [еадег 
| мопаег мну ту Рта |еадег *[п {егт 16 
мгКе5 Чтеоци... *|п тегт 15 «7 
[еадег |5 3 
*[п {егт 16 я 


Тагапфоо| 


(но) ННЕоаа"" 


Как оуегмлем: Ожидания != Реальность 


Ожидаем: 

. Найти лидера быстро 

Не более одного лидера в кластере в конкретный момент времени 
. Возвращение/подключение нод в кластер не вызывает его простоя 


№ НИГоаа ** 
Тагапфоо] (но) на» р 


Как оуеглем/: Ожидания != Реальность 


В процессе тестирования Кай в 
Тагап{оо! мы нашли проблему в 1 2 3 


такой конфигурации: 


И почти сразу нашли, 
что мы не одиноки 


Тагапфоо| 


зибзспЬе Го гесеме поНЯсаНоп$ оЁ пеми ро$Ёз: 


+ ооо Тре СюидВаге В(09 ПОНИ | заьзенье | 


РгодисЕ Мем5 5реед & Кейа у еси Ку 5егуеЦе5$ 7его Тги$Е Оеуе[орег$ 


А Вухап пе РаЦиге т (Ве геа( 
мог(9 


Оп МоуетЬег 2, 2020, СочаНаге Рад ап падепЕ (Ва 1трас(ед (Ре ауаЦаЩКу оЁ 
(Ре АР! апд дазНБоагА Гог ых Воуг$ апд 33 пити(е5. Виппд (5 падепЕ Фе 


(нь) ННГоаа"" 


Вторая перемена блюд 


/ Кай омеглем 

° ]оигпа|, Тегт, 1$№ 

° Выборы 

о Гарантии 

° Ожидания |= Реальность 
. КаН / Тагаптоо!: особенности 
. Надстройки Кай 


° Рге-\фе 
° ЭрИ-\/яже ащесйоп 
°о Кепств 


№ НЕИГоаа ** 
Тагапфоо] (но) на» и 


Тагапоо!: Мультиплексированный журнал 


Тегт 


2 3 
Моде 


1 


|02 паех = 6 


ус1оск = {1 :5, 2: 1} к Е + 
и [>И Гоаа 
Тагапкоо! __ За = 


Тагапфоо!: Рассылка данных от всех ко всем 


Вай 3 Тагапфоо| 3 


№ НЕ>ИГоаа ** 
Тагапфоо] (но нЕ" ы 


Тагапфоо!: Рассылка данных от всех ко всем 


|102 пдех: 0 
2 2 
102 таех: 0 \с1оскК: {1:0, 2:0, 3:0} 
Кай 3 Тагапкос! 3 


. 


мс|осК: {1:0, 2:0, 3:0} 


№ НЕ>ИГоаа ** 
Тагапфоо] (но нЕ" ы 


Тагапфоо!: Рассылка данных от всех ко всем 


|102 паех: 1 
2 7) 
102 таех: 0 мс|оск: {1:0, 2:0, 3:0} 
Кай 3 Тагапкос! 3 


. 


мс|оск: {1:1, 2:0, 3:0} 


№ НЕ>ИГоаа ** 
Тагапфоо] (но нЕ" ы 


Тагапфоо!: Рассылка данных от всех ко всем 


|102 паех: 1 
2 7) 
102 таех: 0 мс1оск: {1:1, 2:0, 3:0} 
Кай 3 Тагапкос! 3 


. 


мс|осК: {1:1, 2:0, 3:0} 


№ НЕ>ИГоаа ** 
Тагапфоо] (но ни" ы 


Тагапфоо!: Броадкаст результатов голосования 


\/ сте Тог те! 


№ НЕ>ИГоаа ** 
Тагапфоо] (но ие 


Тагап{оо!: Броадкаст результатов голосования 


\/оте Гог те! 

1 Сообщения существующих 

типов можно дополнять без 
ОК, 3 моте4 ог 1 нарушения обратной 
совместимости 
2 
| уотеа Гог 1 
3 


№ НИГоаа ** 
Тагапфоо] (но) на» и 


Меню 


/ Кай омеглем 
° Термины: ]доигпа!|, Тегт, 1$М 
° Выборы 
о Гарантии 
° Ожидания |= Реальность 
/ Вак / Тагапфоо!: особенности 
. Надстройки Кай 


° Рге-\Мое 
° ЭрИ-\/яже ащесйоп 
°о Кепств 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» и 


Рге-\/о{е: Проблема №1 


Недоступность кластера на запись после восстановления связности 


4 НИГоаа** 
Тагаптоо! (не) нь ы 


Проблема №1: Пример 


1 1$ [еааег 
Тегт 3 2 Тегт 3 
Рт {Пе 
[еадег 


11$ [еадег 


Тегт 3 


(нь) НН оаа* 
Тагапфоо| а 


Проблема №1: Пример 


1 1$ [еааег 
Тегт 3 2 Тегт 3 
Рт {Пе 
[еадег 


\МПеге’$ 
[еадег? 


Тегт 3 


№ НЕ>ИГоаа ** 
Тагапфоо] (но маи 


Проблема №1: Пример 


1 1$ [еааег 
Тегт 3 2 Тегт 3 
Рт {Пе 
[еадег 


Уфа тЕ 
@есНоп$ 


Тегт 4 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» а 


Проблема №1: Пример 


1 1$ [еааег 
Тегт 3 2 Тегт 3 
Рт {Пе 
[еадег 


\МВеге аге 
ту уо{е$? 


Тегт 4 


№ НЕ>ИГоаа ** 
Тагапфоо] (но маи 


Проблема №1: Пример 


1 1$ [еааег 
Тегт 3 2 Тегт 3 
Рт {Пе 
[еадег 


Уфа тЕ 
@есНоп$ 


Тегт 5 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» а 


Проблема №1: Пример 


1 1$ [еааег 
Тегт 3 2 Тегт 3 
Рт {Пе 
[еадег 


\МВеге аге 
ту ус{е$? 


Тегт 5 


(нь) НН оаа* 
Тагапфоо| не 


Проблема №1: Пример 


\М/Пеге’$ 
[еадег? 


Тегт 3 1 2 Тегт 3 


№ м {егт! 
Кезп 


\ЛПеге аге 
{е5? 
Кластер недоступен и 
для записи 
3 
Тегт 5 


№ НИГоаа ** 
Тагапфоо] (но маи 


Проблема №1: Хотелось бы 


1 1$ [еааег 
Тегт 3 к 2 Тегт 3 
Рт {Пе 
[еадег 


\МПеге’$ 
[еадег? 


Тегт 3 


№ НЕ>ИГоаа ** 
Тагапфоо] (но маи 


Проблема №1: Хотелось бы 


1 1$ [еааег 
Тегт 3 к 2 Тегт 3 
Рт {Пе 
[еадег 


\Мате Гог 
дицогит 


Тегт 3 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) нь р 


Проблема №1: Хотелось бы 


1 1$ [еааег 
Тегт 3 к 2 Тегт 3 
Рт {Пе 
[еадег 


11$ [еадег 


Тегт 3 


№ НЕ>ИГоаа ** 
Тагапфоо] (но маи 


Рге-\/о{е: Проблема №2 


Сервер, который не видит лидера, будет постоянно его прерывать 


стоци „м. Тре СтоиудНаге В о9 ИО | заьзенье | 


РгодисЕ Мем5 5реед & Кейа у еси Ку 5егуеЦе5$ 7его Тги$Е Оеуе[орег$ Оеер Оме ИЕе @СоудАаге 21 


А Вухап пе РаЦиге т (Ве геа( 
муог(Ч 


Оп Моуетьег 2, 2020, СоудНаге Вад ап падепЕ (Ва( итрас(ед (Ре ауаЦа у оЁ 
(Ре АР! апд да$НБоагА Гог ых Воуг$ апд 33 птие5. Виппд (15 падепЕ, Фе 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» р 


Проблема №2: Пример 


Ма 115 
[еадег [еадег 


Тегт 3 2 Тегт 3 


11$ 
|еадег 3 


Тегт 3 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» р 


Проблема №2: Пример 


Ма 115 
|[еадег [еадег 


Тегт 3 2 Тегт 3 


Тегт 3 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» р 


Проблема №2: Пример 


Ма 115 
[еадег [еадег 


Тегт 3 2 Тегт 3 


\Л/Пеге’5 
|еадег? 


Тегт 3 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» р 


Проблема №2: Пример 


Ма 115 
|[еадег [еадег 


Тегт 3 2 Тегт 3 


1еЁ’$ Ламе 
@есНоп$! 


Тегт 4 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» р 


Проблема №2: Пример 


Рип | мотеа 
|[еадег фог 3 


Тегт 3 2 Тегт 4 


[ег’$ Паме 
еесНоп$! 


Тегт 4 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» р 


Проблема №2: Пример 


ЗЗерртЕ | уотед 
дом/п Юг 3 
Тегт 4 1 2 Тегт 4 
Рут [еадег 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» р 


Проблема №2: Пример 


\\Пеге' $ |еа4ег 15 
[еа4ег? Е 
Тегт 4 1 2 Тегт 4 
Рт |еадег 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» р 


Проблема №2: Пример 


1ег’$ Ваме 315 
@есНоп$! |еадег 
Тегт 5 1 2 Тегт 4 
Гт |еадег 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» р 


Проблема №2: Пример 


1ег’$ Ваме 315 
@есНоп$! |еадег 
Тегт 5 1 2 Тегт 4 
Гт |еадег 


Кластер постоянно 
перевыбирает лидера 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» р 


Проблема №2: Как хочется 


Ма 115 
[еадег [еадег 


Тегт 3 2 Тегт 3 


[ег’$ Паме 
еесНоп$! 


Тегт 3 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» р 


Проблема №2: Как хочется 


Ма 115 
[еадег [еадег 


Тегт 3 2 Тегт 3 


[ег’5 Ламе № о. 


. | . . 
аес{оп$! Те |еадег 15 ай\е. 


Тегт 3 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» р 


Проблема №2: Как хочется 


Ма 115 
[еадег [еадег 


Тегт 3 2 Тегт 3 


ОКау 


Тегт 3 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» р 


Проблема №2: Как хочется 


Итак, хотим, чтобы действующего лидера не мог прервать никто 


№ НЕ>ИГоаа ** 
Тагапфоо] (но ни" ы 


Рге-\/ ое: Варианты решения 


1. Предварительные выборы 
° Перед началом выборов спрашиваем, проголосуют ли за нас 


2. Игнорирование выборов голосующими, которые видят лидера 
3. Рге-Уще на основе метаинформации 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» р 


Рге-\/о{е: Варианты решения 


1. Предварительные выборы 
. Перед началом выборов спрашиваем, проголосуют ли за нас 
. Ответ положительный, если голосующий сам не видит лидера, и 
если проголосовал бы за кандидата в обычных выборах 


2. Игнорирование выборов голосующими, которые видят лидера 
3. Рге-Уще на основе метаинформации 


№ НИГоаа ** 
Тагапфоо] (но) на» р 


Рге-\/о{е: Варианты решения 


1. Предварительные выборы 
° Перед началом выборов спрашиваем, проголосуют ли за нас 
° Ответ положительный, если голосующий сам не видит лидера, и 
если проголосовал бы за кандидата в обычных выборах 
. После получения кворума положительных ответов начинаем 
выборы 
2. Игнорирование выборов голосующими, которые видят лидера 
3. Рге-Уще на основе метаинформации 


№ НИГоаа ** 
Тагапфоо] (но) на» и 


Предварительные выборы: Пример №1 


1 15 |еадег 


Тегт 3 к 2 Тегт 3 


Рт {Ре 
|еадег /2- 
57 \МПеге”$ К 


[еадег? 


Тегт 3 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» р 


Предварительные выборы: Пример №1 


1 15 |еадег 


Тегт 3 и 2 Тегт 3 


Рт {пе 
|еадег /2- 
5) М/ант Гог = 


дчогит 


Тегт 3 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» р 


Предварительные выборы: Пример №2 


Ма 115 
[еадег [еадег 


Тегт 3 2 Тегт 3 


[ег’$ Паме 
еесНоп$! 


Тегт 3 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» р 


Предварительные выборы: Пример №2 


Ма 115 
[еадег [еадег 


Тегт 3 2 Тегт 3 


[ег’5 Ламе Мо. 


. | . . 
аес{оп$! Тре [еадег 15 аЙ\е. 


Тегт 3 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» р 


Предварительные выборы: Пример №2 


Ма 115 
[еадег [еадег 


Тегт 3 2 Тегт 3 


ОКау 


Тегт 3 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» р 


Рге-\/о{е: Варианты решения 


1. Предварительные выборы 
° Перед началом выборов спрашиваем, проголосуют ли за нас 
Ответ положительный, если голосующий сам не видит лидера и 
если проголосовал бы за кандидата в обычных выборах 
. После получения кворума положительных ответов начинаем 
выборы 
2. Игнорирование выборов голосующими, которые видят лидера 
3. Рге-Уще на основе метаинформации 


Недостаток — требуется новый тип сообщений, ломающий обратную 
совместимость с существующими инсталляциями 


№ НИГоаа ** 
Тагапфоо] (но) на» р 


Рге-\/ ое: Варианты решения 


1. Предварительные выборы 
2. Игнорирование выборов голосующими, которые видят лидера 


3. Рге-Уще на основе метаинформации 


№ НИГоаа ** 
Тагапфоо] (но) на» р 


Рге-\/о{е: Варианты решения 


1. Предварительные выборы 
2. Игнорирование выборов голосующими, которые видят лидера 
. Сервер, видящий лидера напрямую, игнорирует любые запросы 
на голос от соседей 
3. Рге-Уще на основе метаинформации 


№ НИГоаа ** 
Тагапфоо] (но) на» и 


Игнорирование: Пример №1 


Тегт 3 и 


Рт {ре 


еадег > 


Тагапфоо| 


1 15 |еадег 


2 Тегт 3 


\№МПеге’5 К 


[еадег? 


Тегт 3 


(но) ННЕоаа"" 


Игнорирование: Пример №1 


Тегт 3 @ 


Рт {ре 


еадег р 


Тагапфоо| 


1 15 |еадег 


2 Тегт 3 


1ег’$ Ваме у 


еесоп$! 


Тегт 4 


(но) ННЕоаа"" 


Игнорирование: Пример №1 


1 15 |еадег 


Тегт 3 и 2 Тегт 3 


Рт {ре 


|еа4ег /2- 
5) \МПеге аге 
ту уо{е$? 


Тегт 4 


№ НЕ>ИГоаа ** 
Тагапфоо] (но маи 


Игнорирование: Пример №1 


1 15 |еадег 


Тегт 3 1 2 Тегт 3 


З4еррт? 
Чом/п 


\МВеге аге 
ту уо{е$? 


Тегт 4 


(нь) НН оаа* 
Тагапфоо! не 


Рге-\/о{е: Варианты решения 


1. Предварительные выборы 
2. Игнорирование выборов голосующими, которые видят лидера 
. Сервер, видящий лидера напрямую, игнорирует любые запросы 
на голос от соседей 
3. Рге-Уще на основе метаинформации 


Недостаток — решение неполное! 


№ НИГоаа ** 
Тагапфоо] (но) на» р 


Рге-\/ ое: Варианты решения 


1. Предварительные выборы 
2. Игнорирование выборов голосующими, которые видят лидера 
3. Рге-\/се на основе метаинформации 
Каждый сервер знает состояние Кай соседей за счет 
широковещательной рассылки 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» и 


Рге-\/о{е: Варианты решения 


1. Предварительные выборы 

2. Игнорирование выборов голосующими, которые видят лидера 

3. Рге-\/се на основе метаинформации 
Каждый сервер знает состояние Кай соседей за счет 
широковещательной рассылки 
Добавим в сообщение о состоянии информацию о том, виден ли 


лидер 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» и 


Рге-\/о{е: Варианты решения 


1. Предварительные выборы 

2. Игнорирование выборов голосующими, которые видят лидера 

3. Рге-\/се на основе метаинформации 
Каждый сервер знает состояние Кай соседей за счет 
широковещательной рассылки 
Добавим в сообщение о состоянии информацию о том, виден ли 
лидер 
Если кто-то видит лидера в текущем терме - не начинаем 
выборы 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» и 


Рге-\/оте 


Тегт 3 


‚ Пример №1 


Рт {ре 


Тагапфоо| 


|[еааег 


1 15 |еадег 


2 Тегт 3 


М/а т ог м 


ачогит 


Тегт 3 


(нь) ННЕоаа** 


Рге-\/ое: Пример №1 


1 15 |еадег 


Тегт 3 2 Тегт 3 


Рт {ре 


|еадег /2- 
5) 1 1$ [еааег 


Тегт 3 


(нь) НН оаа* 
Тагапфоо| а 


Рге-\/о{е: Пример №2 


Рип 1 15 
|еааег |еааег 
Тегт 3 е 2 Тегт 3 
1 15 [еадег 
3 


Тегт 3 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» р 


Рге-\/о{е: Варианты решения 


1. Предварительные выборы 
2. Игнорирование выборов голосующими, которые видят лидера 
3. Рге-\/се на основе метаинформации 
. Каждый сервер знает состояние Кай соседей за счет 
широковещательной рассылки 
. Добавим в сообщение о состоянии информацию о том, виден ли 
лидер 
. Если кто-то видит лидера в текущем терме - не начинаем 
выборы 


Решение как с предварительными выборами, но обратно совместимое 


№ НИГоаа ** 
Тагапфоо] (но) на» р 


Меню 


/ Кай омеглем 
° Термины: ]доигпа!|, Тегт, 1$М 
° Выборы 
о Гарантии 
° Ожидания |= Реальность 
/ Вак / Тагапфоо!: особенности 
е Надстройки Кай 


/ Рге-\/ое 
‚ ЭрШИ-/мще деаесйоп 
о Кепств 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» и 


5р!(-\/оте: Проблема 


Долгая недоступность кластера на запись после потери лидера 


№ НЕИГоаа ** 
Тагапфоо] (но) на» р 


5р!(-\/оте: Проблема 


Долгая недоступность кластера на запись после потери лидера 


Каждый раунд выборов, в результате которого не выбран лидер — 
> 5 секунд простоя 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» р 


5р!(-\/оте: Проблема 


Долгая недоступность кластера на запись после потери лидера 


Каждый раунд выборов, в результате которого не выбран лидер — 
> 5 секунд простоя 


В случае успешных выборов лидер появляется в самом начале раунда 


№ НИГоаа ** 
Тагапфоо] (но) на» р 


5р!(-\/оте: Проблема 


Долгая недоступность кластера на запись после потери лидера 


Каждый раунд выборов, в результате которого не выбран лидер — 
> 5 секунд простоя 


В случае успешных выборов лидер появляется в самом начале раунда 


Если голоса разделились, оставшееся время раунда — простой 


№ НИГоаа ** 
Тагапфоо] (но) на» р 


5ри-\/де: Решение 


У нас есть широковещательная рассылка отданных голосов 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» р 


5ри-\/де: Решение 


У нас есть широковещательная рассылка отданных голосов 


Каждый из узлов может вести подсчёт голосов за всех кандидатов 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» р 


5ри-\/де: Решение 


У нас есть широковещательная рассылка отданных голосов 
Каждый из узлов может вести подсчёт голосов за всех кандидатов 


Стало понятно, что выборы никто не выиграет? Новый раунд 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» р 


5ри-\/де: Решение 


У нас есть широковещательная рассылка отданных голосов 
Каждый из узлов может вести подсчёт голосов за всех кандидатов 
Стало понятно, что выборы никто не выиграет? Новый раунд 


Экономия до 90% времени на каждый раунд с разделившимися 
голосами 


№ НИГоаа ** 
Тагапфоо] (но) на» р 


Меню 


/ Кай омегмем 
° Термины: ]доигпа!|, Тегт, 1$М 
° Выборы 
о Гарантии 
° Ожидания |= Реальность 
/ Вак / Тагапфоо!: особенности 
е Надстройки Кай 
/ Рге-—\№оте 
/ эри-Умще ащесйоп 
°о Кепствй 


№ НЕИГоаа ** 
Тагапфоо] (но) на» р 


Гепсто: Проблема 


. Для записи в кластер необходимо обратиться к текущему лидеру 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) на» р 


Гепсто: Проблема 


. Для записи в кластер необходимо обратиться к текущему лидеру 
е Возможность существования нескольких нод, считающих себя 
лидерами одновременно (в разных {егт) 


№ НЕ>ИГоаа ** 
Тагапфоо] (но) нь р 


Гепсте: Проблема №1 


. Для записи в кластер необходимо обратиться к текущему лидеру 

. Возможность существования нескольких нод, считающих себя 
лидерами одновременно (в разных {егт) 

. Не более одного из “лидеров” сможет на самом деле произвести 
синхронную запись 


4 НИГоаа** 
Тагаптоо! (не) нь ы 


Гепстз: Пример №1 


[еадег 1$ 1 
Рт [еа4дег 


Тегт 15 
3 Тегт 15 


[еадег 1$ 1 


2 Тегт 15 


(нь) НН оаа* 
Тагапфоо| а 


Гепстз: Пример №1 


[еадег 1$ 1 
Рт [еа4дег 


Тегт 15 
3 Тегт 15 
ей 


2 Тегт 15 


(нь) НН оаа* 
Тагапфоо| не 


Гепстз: Пример №1 


| Рт [еадег 
Гт [еадег 


Тегт 15 
Тегт 16 


[еадег 1$ 3 


2 Тегт 16 


(нь) НН оаа* 
Тагапфоо| а 


Гепстэя: Пример №1 


| мопаег м/Пу аа 

т [еадег 
и Рт |еа4ег 

итеоц:... 


Тегт 15 
Тегт 16 


[еадег 1$ 3 


2 Тегт 16 


(нь) НН оаа* 
Тагапфоо| а 


Гепсто: Проблема №2 


к 77 


е При наличии рге-уо{е можно получить “заблокированный” кластер 


4 НИГоаа** 
Тагаптоо! (не) нь ы 


Гепстз: Пример №2 


(нь) НН оаа* 
Тагапфоо| а 


Гепстз: Пример №2 


(нь) НН оаа* 
Тагапфоо| а 


Гепстз: Пример №2 


(нь) НН оаа* 
Тагапфоо| а 


Гепстз: Пример №2 


(нь) НН оаа* 
Тагапфоо| а 


Гепстэя: Пример №2 


(нь) Нноаа** 
Тагапфоо! ее 


Гепсто: Способы решения 


Для определения текущего лидера запрашивать у всех нод кластера 
текущий терм и состояние ноды (лидер или нет) 

е Переложить определение лидера на внешнюю систему, 
гарантирующую его единственность, и довериться ей 

. Доработать КАГТ в Тагаптоо! 


№ НИГоаа ** 
Тагапфоо] (но) на» и 


Гепсто: Способы решения 


1. Для определения текущего лидера запрашивать у всех нод 
кластера текущий терм и состояние ноды (лидер или нет) 


2. Переложить определение лидера на внешнюю систему, 
гарантирующую его единственность, и довериться ей 
3. Доработать КАЕТ в Тагапфоо| 


№ НИГоаа ** 
Тагапфоо] (но) на» р 


Гепсто: Способы решения 


1. Для определения текущего лидера запрашивать у всех нод 
кластера текущий терм и состояние ноды (лидер или нет) 
. Не решает проблему заблокированного кластера 


2. Переложить определение лидера на внешнюю систему, 
гарантирующую его единственность, и довериться ей 
3. Доработать КАЕТ в Тагапфоо| 


№ НИГоаа ** 
Тагапфоо] (но) на» р 


Гепсто: Способы решения 


1. Для определения текущего лидера запрашивать у всех нод 
кластера текущий терм и состояние ноды (лидер или нет) 
. Не решает проблему заблокированного кластера 
. Увеличивается время недоступности на запись 


2. Переложить определение лидера на внешнюю систему, 


гарантирующую его единственность, и довериться ей 
3. Доработать КАЕТ в Тагапфоо| 


№ НИГоаа ** 
Тагапфоо] (но) на» р 


Гепсто: Способы решения 


1. Для определения текущего лидера запрашивать у всех нод 
кластера текущий терм и состояние ноды (лидер или нет) 
. Не решает проблему заблокированного кластера 
. Увеличивается время недоступности на запись 
. Требуется реализация данного решения во всех клиентах 
2. Переложить определение лидера на внешнюю систему, 
гарантирующую его единственность, и довериться ей 
3. Доработать КАЕТ в Тагапфоо| 


№ НИГоаа ** 
Тагапфоо] (но) на» и 


Гепсто: Способы решения 


1. Для определения текущего лидера запрашивать у всех нод кластера 
текущий терм и состояние ноды (лидер или нет) 

2. Переложить определение лидера на внешнюю систему, 
гарантирующую его единственность, и довериться ей 


3. Доработать КАЕТ в Тагапфоо| 


№ Н>ИГоаа ** 
Тагапфоо] (но) на» р 


Гепсто: Способы решения 


1. Для определения текущего лидера запрашивать у всех нод кластера 
текущий терм и состояние ноды (лидер или нет) 

2. Переложить определение лидера на внешнюю систему, 
гарантирующую его единственность, и довериться ей 
.  Доверяем решение проблемы третьей системе 


3. Доработать КАЕТ в Тагаптоо| 


№ Н>ИГоаа ** 
Тагапфоо] (но) на» р 


Гепсто: Способы решения 


1. Для определения текущего лидера запрашивать у всех нод кластера 
текущий терм и состояние ноды (лидер или нет) 

2. Переложить определение лидера на внешнюю систему, 
гарантирующую его единственность, и довериться ей 
. Доверяем решение проблемы третьей системе 
. Еще одна точка отказа 

3. Доработать КАЕТ в Тагапфоо| 


№ Н>ИГоаа ** 
Тагапфоо] (но) на» и 


Гепсто: Способы решения 


1. Для определения текущего лидера запрашивать у всех нод кластера 
текущий терм и состояние ноды (лидер или нет) 

Переложить определение лидера на внешнюю систему, 
гарантирующую его единственность, и довериться ей 

Доработать КАГТ в Тагапфоо| 


(но) ННЕоаа"" 


Тагапфоо| 


Гепсте: Как хочется 


ПУ Те.е] < , 
зотем/йеге Е Рт [еадег 
е|бе {Реп 
Тегт 15 
Тегт 16 
1 
[еадег 1$ 3 


2 Тегт 16 


(нь) Нноаа** 
Тагаптоо! 2022 


Как хочется 


- 8) 
< |’ по* [еа4ег 


д 


й | ++ 
ОК, [ег’5 уо{е! (нь) ННЕоаа"" 


Тагапфоо| 


Гепстз: Решение 


Нода, являющаяся лидером, следит за обрывом соединений к/от 
реплик 


Если количество живых соединений стало меньше, чем текущий кворум, 
лидер снимает с себя полномочия 


№ НИГоаа ** 
Тагапфоо] (но) на» р 


Гепстз: Решение 


| Тите 


[| Тайм-аут репликации а НЕ \ Нньоаа“ 
Тагапфоо! [_] Тайм-аут выборов 2022 


Гепстз: Решение 


| Тите 


[| Тайм-аут репликации а НЕ \ Неньоаа* 
Тагапфоо! [_] Тайм-аут выборов 2022 


Гепстз: Решение 


бо е. те 


[| Тайм-аут репликации т НЕ \ Нньоаа“ 
Тагапфоо! [_] Тайм-аут выборов 2022 


Гепстз: Решение 


Тагапфоо| 


и Е Тите 


У ++ 
[| Тайм-аут репликации № Нарушение связности |. ,„., НЫ) Н=Роаа** 
|| Тайм-аут выборов ее 


Гепстз: Решение 


Тагапфоо| 


| | ь Тите 

х ++ 
[| Тайм-аут репликации № Нарушение связности |..„., НЕ \ Неньоаа* 
|| Тайм-аут выборов [| Время голосования ее 


Гепстз: Решение 


х/ | | | 


им 

| | 

| | 

| 

| 

| 

| 

| 

| | | 

| | | | 
[| Тайм-аут репликации № Нарушение связности |..„., НЕ Н2НГоаа** 

2022 


Тагапфоо! || Тайм-аут выборов [| Время голосования 


Гепстз: Решение 


| Тите 


[| Тайм-аут репликации а НЕ \ Неньоаа* 
Тагапфоо! [_] Тайм-аут выборов 2022 


Гепстз: Решение 


Тагапфоо| 


х/ | | | 


м 


РЖИ ДИ 


| 


О | е ей Тите 

У ++ 
[| Тайм-аут репликации № Нарушение связности |..„., НЕ \ НН оаа* 
|| Тайм-аут выборов [| Время голосования ее 


Гепстз: Решение 


Три варианта применения Гепсте: 


1. Еепсте выключен 
2. Слабый Тепсте — более быстрый фейловер, но можно увидеть двух 


лидеров 
3. Сильный Тепсте -— точно не будет двух лидеров 


(но) ННЕоаа"" 


Тагапфоо| 


Ожидали от Кай 


. Один лидер натерм == один лидер в данный момент времени 
. Лидер постоянен 
е Быстрая смена лидера 


№ НЕИГоаа ** 
Тагапфоо] (но) на» р 


Получили 


е Один лидер на терм == один лидер в данный момент времени -— 
Гепсйй 

. Лидер постоянен - Рге-\/де, Гепстя 

е Смены лидера — $рИ-\/ое дщесйоп позволил ускорить выборы ^10 
раз 


№ НИГоаа ** 
Тагапфоо] (но) на» р 


В тнАя СВЯЗЬ 
| и комментарии по докладу 


‘по ссыл ке _ 
и 


НЕ | НЕРЕсаа ны 


` 2022 


Та в \ 


